Bài học 5 đánh dấu một bước ngoặt quan trọng trong COMP5511. Chúng ta đang chuyển dịch khỏi logic xác định của điện toán cổ điển và sự chắc chắn được giám sát của các mô hình phân loại ban đầu sang trọng tâm xác suất của AI Tạo sinh. Trong buổi học này, chúng ta khám phá lý do tại sao các mô hình AI hiện đại không xuất ra "sự thật" mà thay vào đó là phân phối xác suất, khám phá các cơ chế cho phép LLM viết thơ và các mô hình khuếch tán vẽ từ nhiễu.
1. Sự thay đổi Mô hình: Từ Logic sang Xác suất
- Vượt ra ngoài IF-THEN: Chuyển đổi từ các quy tắc cứng nhắc sang khả năng thống kê linh hoạt.
- Kết thúc sự chắc chắn: Hiểu lý do tại sao kết quả GenAI lại phi xác định theo thiết kế.
- Xác suất như một Công cụ: Cách "Kỷ nguyên GenAI" coi sự không chắc chắn như một đặc điểm cho sự sáng tạo thay vì một lỗi cần sửa.
2. Các Công cụ Xác suất Sáng tạo
AI Tạo sinh dựa vào việc lấy mẫu từ các không gian xác suất nhiều chiều. Dù tạo văn bản hay hình ảnh, mô hình điều hướng sự không chắc chắn để tạo ra sự mới lạ:
- Mô hình Ngôn ngữ Lớn (LLM): Dự đoán token tiếp theo không phải là một lựa chọn duy nhất, mà là phân phối các khả năng.
- Mô hình Khuếch tán: Nghệ thuật kỹ thuật đảo ngược trật tự từ nhiễu Gaussian hỗn loạn.
- Quá trình Lấy mẫu: Làm thế nào sự ngẫu nhiên được khai thác để ngăn chặn các kết quả lặp đi lặp lại và "máy móc".
3. Các Tác nhân trong Thế giới Không thể đoán trước
Các Tác nhân Tự trị phải điều hướng " Thế giới Mở" nơi mọi hành động mang một mức độ rủi ro và phần thưởng không xác định.
Sự đánh đổi Ảo giác
Các mô hình hoàn toàn xác định thì an toàn nhưng thiếu tư duy nguyên bản. Bằng cách chấp nhận sự không chắc chắn, chúng ta cho phép sự sáng tạo, nhưng chúng ta cũng đưa ra rủi ro về Ảo giác—nơi mô hình tự tin tạo ra thông tin hợp lý nhưng sai lầm.
Logic Lấy mẫu Khái niệm
1
Định nghĩa hàmTạo_Phản_hồi (Gợi ý,Nhiệt độ) :
2
Tính toánphân phối xác suất cho tất cả các token tiếp theo có thể;
3
Điều chỉnh phân phối dựa trên Nhiệt độ (Cao hơn = đa dạng hơn, Thấp hơn = tập trung hơn) ;
4
Chọn token tiếp theo bằng cách sử dụng Chọn Ngẫu nhiên Có trọng số;
5
Lặp lại cho đến khi hoàn thành.
Mô hình hóa Xác suất
AI hiện đại nhìn thế giới qua lăng kính thống kê thay vì sự thật nhị phân.